智能论文笔记

On the Robustness of Bayesian Neural Networks to Adversarial Attacks

Luca Bortolussi , Ginevra Carbone , Luca Laurenti , Andrea Patane , Guido Sanguinetti , Matthew Wicker

分类：机器学习 | 人工智能

2022-07-13

对对抗攻击的脆弱性是在安全至关重要应用中采用深度学习的主要障碍之一。尽管做出了巨大的努力，但无论是实用还是理论上的，培训深度学习模型对对抗性攻击仍然是一个悬而未决的问题。在本文中，我们分析了大数据，贝叶斯神经网络（BNNS）中的对抗性攻击的几何形状。我们表明，在限制下，由于数据分布的堕落而产生了基于梯度的攻击的脆弱性，即当数据位于环境空间的较低维度的亚策略上时。直接结果，我们证明，在此限制下，BNN后代对基于梯度的对抗性攻击是强大的。至关重要的是，我们证明，即使从后部采样的每个神经网络都很容易受到基于梯度的攻击，因此相对于BNN后验分布的预期损失梯度正在消失。 MNIST，时尚MNIST和半卫星数据集的实验结果，代表有限的数据制度，并接受了汉密尔顿蒙特卡洛和变异推理的BNN，支持这一论点，表明BNN可以在清洁数据和稳健性上表现出很高的精度对基于梯度和无梯度的对抗性攻击。

translated by 谷歌翻译

我们采用变化性AutoEncoders从单粒子Anderson杂质模型谱函数的数据集中提取物理洞察。培训AutoEncoders以查找低维，潜在的空间表示，其忠实地表征培训集的每个元素，通过重建误差测量。变形式自动化器，标准自动化器的概率概括，进一步条件促进了高度可解释的特征。在我们的研究中，我们发现学习的潜在变量与众所周知的众所周知，但非活动的参数强烈关联，这些参数表征了安德森杂质模型中的紧急行为。特别地，一种潜在的可变变量与粒子孔不对称相关，而另一个潜在的变量与杂质模型中动态产生的低能量尺度接近一对一的对应关系。使用符号回归，我们将此变量模拟了该变量作为已知的裸物理输入参数和“重新发现”的kondo温度的非扰动公式。我们开发的机器学习管道表明了一种通用方法，它开启了发现其他物理系统中的新领域知识的机会。

translated by 谷歌翻译